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基于 “全 评价 ”理论 的 高 校 图 书 馅 热门 TOP 图 书 推荐 
模型 研究 ” 


目 刘 丽 帆 ” 朱 紫阳 
' 南京 信息 工程 大 学 经 济 管理 学 院 ”南京 210044 “南京 信息 工程 大 学 图 书馆 ”南京 210044 


摘要 : [目的 /意义 ] 构 建 适合 大 学 生 阅 读 的 热门 TOP 图 书 推荐 模型 ,为 高 校 图 书馆 阅读 推广 提供 参考 。 
[方法 /过程 ] 通 过 整理 、 分 析 和 挖掘 国 内 89 所 高 校 图 书馆 的 OPAC 图 书 检索 的 数据 信息 ,运用 “全 评价 ”理论 体 
系 ,将 层次 分 析 法 与 决策 树 模 型 相 结合 ,对 高 校 学 生 的 阅读 倾向 进行 分 析 和 评价 。[ 结果 /结论 ] 经 过 预测 与 评 
价 分 析 ,证 明 该 模型 合理 、 准 确 且 具有 重要 的 现实 意义 。 

关键 词 : 热门 TOP 图 书 图书 评价 “全 评价 ”理论 体系 ”阅读 推广 AHP 决策 树 
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联机 公共 目录 查询 系统 ,将 其 热门 图 书 借阅 查询 记录 
ws 作为 研究 主体 。 为 了 更 好 地 展示 和 提升 研究 主体 的 数 
导读 对 了 大 字 生 而 宇 ,基地 当知 识 的 有 效 方 法 ,是 。 据 价 值 ,我 们 引入 叶 继 元 教授 的 “全 评价 "理论 体系 ， 


开启 心灵 对 话 .获得 人 类 生命 体验 的 一 种 重要 模式 ,也 构建 高 校 图 书馆 热 门 TOP 图 书 推荐 模型 ， 并 为 高 校 图 


是 基价 信 观 形成 的 重要 过 程 ,因此 阅读 的 重要 性 入 唐 。。 书馆 阅读 推广 提供 另 一 种 不 同 的 思路 和 建议 , 即 从 高 


为 特征 的 浅 阅 读 、 翻 阅 图 文书 刊 为 主 的 轻 阅 读 以 及 内 的 作品 为 “热门 TOP 图 书 ” 以 数据 展示 的 方式 推荐 适 


容 令 片 化 的 泛 阅 读 等 多 种 阅读 方式 ,使 得 大 学 生 对 于 合 大 学 生 和 群体 阅读 的 热门 书 单 , 从 而 激发 当代 大 学 生 


原著 图 书 和 经 典 图 书 的 兴趣 大 大 降低 ,这 引起 了 很 多 对 图 书 的 阅读 兴趣 ,提升 其 科学 人 文 素养 。 目 前 通用 


业 阁 人 二 的 关注 ,纷纷 推出 多 种 特点 鲜明 的 阅读 推广 ”的 中 图 法 共有 22 个 基本 大 类 ,而 文学 I 大 类 图 书 的 受 


ws 


服务 ,从 不 同 角度 向 读者 推荐 书 单 ,引导 大 学 生 进行 。 从 范围 最 为 广泛 ,本 研究 特 以 此 类 图 书 为 构建 模型 的 
深 陇 阅读 。 但 由 于 大 学 生 个 体 的 差异 以 及 时 代 的 变 。 样本. 
化 ,各 种 努力 往往 事与愿违 ,这 些 推荐 的 图 书 并 不 完全 
符合 读者 的 阅读 需求 ,于 是 便 出 现 了 一 系列 “ 欲 伐 书 
单 “ 最 恨 书 单 …“ 死 活 读 不 下 排行 榜 " 等 *- 。 由 此 可 图 书评 价 早先 使 用 的 是 基本 的 二 元 评价 法 ,该 方 
以 试想 :大 学 图 书馆 里 的 海量 藏书 被 众多 读者 检索 借 。 法 将 定性 分 析 与 定量 分 析 相 结合 ,成 为 后 期 出 现 的 多 
阅 ,根据 这 些 数据 ,并 与 时 代 特 征 进行 对 搂 ,或 许 能 提 样 的 评价 方法 的 起 源 。 但 二 元 评价 范围 太 过 笼统 , 根 
供 一 份 与 众 不 同 的 经 典 热 门 TOP 图 书 推荐 书 单 。 据 研究 的 需要 ,又 出 现 了 一 系列 针对 性 更 强 的 评价 方 
考虑 到 当下 我 国 大 陆 高 校 图 书馆 较 多 采用 汇 文公 ”法 ,例如 , 李 雁 钢 等 "在 2013 年 提出 的 五 维 图 书评 价 
司 的 Libsys 图 书 管理 系统 ,因此 我 们 在 汇 文官 网 上 找 。 体系 ,虽然 该 方法 较为 系统 和 完善 ,但 仅 为 出 版 社 与 图 
到 其 大 陆 高 校 用 户 名 单 中 ,并 逐一 点 击 其 网 站 中 书馆 等 机 构 部 门 提供 服务 ,适用 主体 范围 有 限 ; 任 红 
OPAC 系统 ,选取 能 够 正常 打开 的 89 所 高 校 图 书馆 的 。 娟 "在 (我 国 图 书评 价 方法 研究 述评 ) 一 文 的 结论 中 
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提出 ,在 众多 图 书评 价 方法 中 ,以 读者 评论 为 数据 源 是 
一 种 新 兴 的 评价 方法 ,尽管 这 些 评价 可 以 反映 图 书 的 
受 欢 迎 程度 , 却 反映 不 了 图 书 的 学 术 影响 力 , 即 不 能 作 
为 图 书 质量 的 直接 测度 指标 ; 刘 丹 妮 、 崔 立新 等 所 在 
2015 年 提出 构建 图 书 内 容 质 量 评价 指标 体系 ,该 指标 
体系 在 出 版 行业 图 书 内 容 的 专业 评价 上 较为 全 面 和 专 
业 , 但 用 以 指导 大 学 生 群 体 阅读 却 不 太 合 适 ;同样 , 何 
峻 . 蔡 医 华中 在 2016 年 提出 的 中 文 图 书评 价 体系 也 是 
注重 对 图 书本 身 的 评价 ,而 未 关注 受众 的 体验 。 

由 此 ,在 兼顾 图 书 质量 和 用 户 体验 的 基础 上 ,本 研 
究 基础 定位 于 “全 评价 ”理论 ,该 理论 是 叶 继 元 及 其 团 
队 在 2010 年 提出 的 一 种 三 维 评价 体系 , 即 形式 评价 、 
内 容 评价 和 效用 评价 ""”。“ 全 评价 ”理论 体系 自 提出 
至 今 ,已 经 相对 成 熟 , 且 适 用 面 广 ,目前 已 经 在 期 刊 质 
量 评价 .馆藏 评价 .图 书馆 管理 创新 评价 甚至 高 校 师 德 
评 克 等 诸多 领域 被 应 用 。 


3 数据 采集 与 整理 


“全 评价 ”理论 体系 要 求 数据 要 真实 、 完 整 且 全 
面 , 本 研究 在 通过 人 工 筛选 可 用 高 校 图 书馆 网 址 的 前 
提 下 ,选取 当下 国内 高 校 图 书馆 同时 使 用 汇 文系 统 的 
共计 89 所 高 校 的 数据 作为 研究 样本 ,部 分 高 校 图 书馆 
网 址 见 表 1。OPAC 系统 的 一 致 性 保证 了 数据 页 面 的 
整齐 性 和 源 代码 的 规律 性 ,因此 利用 Python 根据 网 页 
源 代码 特点 设计 程序 ,自动 抓 取 各 高 校 图 书馆 OPAC 
的 热门 图 书 数据 ,分 两 次 得 到 2016 年 -2017 年 22 个 
类 别 的 TOP100 作品 信息 及 其 热门 图 书 浏览 数据 。 本 
研究 以 文学 1 类 为 例 ,从 浏览 量 \ 版 次 出 版 社 等 多 个 
方面 进行 考量 ,根据 形式 评价 内容 评价 和 效用 评价 为 
基本 思路 ,构建 适合 大 学 生 阅读 的 热门 TOP 图 书评 价 
模型 。 


表 1 89 所 高 校 图 书馆 OPAC 网 址 列表 ( 按 字母 排列 前 20 所 高 校 ) 


| 


书馆 OPAC 网 址 


北京 科技 大 学 
北京 理工 大 学 
北京 林业 大 学 
大 连 工 业 大 学 
大 连理 工大 学 
大 连 医 科大 学 
东北 财经 大 学 


东北 林业 大 学 


东北 农业 大 学 
了 东南 大 学 
1 福建 农林 大 学 
a, 福建 师范 大 学 
13 福建 中 医药 大 学 
14 广西 师范 大 学 
15 杭州 电子 科技 大 学 
16 河北 科技 大 学 
17 河北 师范 大 学 
18 湖北 大 学 
19 湖北 工业 大 学 
20 华北 电力 大 学 


本 研究 主要 使 用 Excel 的 开发 工具 VB 与 Access 
的 查询 向 导 对 数据 进行 整理 .统计 ,每 次 处 理 后 还 需 经 
过 人 工 检验 ,确认 其 数据 的 准确 性 。 其 中 总 浏览 量 需 
要 修正 学 校 间 的 差异 ,对 于 不 属于 文学 类 作品 或 浏览 
量 数 据 过 于 “突出 ”的 作品 ,同样 需 进行 检验 或 修正 。 

从 浏览 量 数据 来 看 ,归并 整理 后 浏览 总 量 大 于 
10 000 次 的 热门 浏览 图 书 排行 榜 前 20 名 见 表 2。 相 比 
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http ://lib. ustb. edu. en :8080/top/top_book. php? cls_no =I 
http://ico. bit. edu. cn/ top/top_book. php 
http ://202.204. 121.41 :8080/top/top_book. php? cls_no =I 
http ://219. 216. 175. 5 :8080/top/top_book. php? cls_no =I 
http ://opac. lib. dlut. edu. cn/top/top_book. php 
http://210. 47.255.5 :8080/top/top_book. php? cls_no =I 
http ://www. lib. dufe. edu. cn :8088/top/top_book. php? cls_no =I 
http://libopac. nefu. edu. cn:8080/top/top_book. php? cls_no=I 
http://219.217.211.9.:8080/top/top_book. php 
http://www. libopac. seu. edu. cn :8080/top/top_book. php 
http ://210. 34. 85. 114 :8080/top/top_book. php? cls_no =I 
http://libopac. fjnu. edu. en/top/top_book. php? cls_no =I 
http ://210. 34. 66. 82 ;8080//top/top_book. php? cls_no =I 
http://opac. gxnu. edu. cn/top/top_book. php? cls_no =I 
http://210. 32.33. 91 :8080/top/top_book. php? cls_no =I 
http://202. 206. 64.251 :88/top/top_book. php? cls_no =I 
http ://202. 206. 108. 2 :8080/opac/openlink. php? title = 1&with_ebook = on 
http ://59. 68. 64. 61 :8080/top/top_book. php? cls_no =I 
http ://202. 114. 181. 8 :8080/top/top_book. php? cls_no =I 


http ://202. 206. 214. 254 :8080/opac/ book_score_rank. php? cls_no =I 


另 一 组 数据 , 即 吴 汉 华 编制 的 我 国 20 所 “985 工程 ”高 
校 的 图 书 借阅 排行 榜 中 登 榜 频 次 大 于 2 的 图 书 列表 ， 
其 中 有 18 种 属于 文学 类 图 书 ,挑选 出 后 与 本 研究 在 数 
据 统计 过 程 中 根据 浏览 量 总 数 进行 排名 所 得 的 表 2 进 
行 比 对 ,有 12 种 可 在 热门 浏览 图 书 中 找到 ,其 中 
TOP 20 中 有 4 本 与 之 相同 ,这 4 本 相同 作品 在 表 2 
中 做 加 粗 标记 。 可 见 ,“985 工程 ”高 校 大学生 热门 借阅 
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图 书 中 的 文学 类 图 书 与 本 研究 数据 处 理 过 程 中 所 得 到 
的 文学 类 图 书 浏览 量 总 数 排名 中 的 TOP 图 书 吻合 度 较 
高 ,同时 也 从 男 一 层面 证 明 将 热门 图 书 浏览 量 作为 本 次 
推荐 模型 中 的 主要 参考 指标 ,具有 一 定 的 合理 性 。 

表 2 高 校 大 学 生 热 门 浏览 图 书 排行 榜 (TOP 20) 


序号 作品 出 现 次 数 浏览 总 量 
1 平凡 的 世界 571 1 466 297 
2 围城 334 486 568 
3 百年 孤独 266 475 252 
4 狼 图 腾 110 472 760 
5 挪威 的 森林 215 383 450 
6 苏 菲 的 地界 154 376 262 
追 风 黎 的 人 107 375 856 
8 秆 斯 厅 的 葬礼 200 345 731 

中 倾城 之 恋 193 306 939 
53 盗墓 笔记 245 265 712 
i) 不 能 承受 的 生命 之 轻 97 240 618 

) 活着 187 209 485 
麦田 里 的 守望 者 165 206 327 

三 体 117 172 764 

杜 拉 拉 升 职 记 53 148 120 

看 见 79 142 518 

夜行 109 139 217 

天 才 在 左 疯子 在 右 57 135 667 

鹿 原 136 135 011 

致 我 们 终 将 逝去 的 青春 79 134 751 


主 :加 粗 文字 为 与 参考 文献 "对比 后 的 相同 作品 


(6 考虑 到 文学 类 图 书 的 特殊 性 ,除了 统计 热门 图 书 


、 


的 员 览 量 外 ,本 研究 还 整理 了 图 书 出 现 版 次 ,在 国 内 影 
响 郧 较 大 的 茂 盾 文学 奖 获奖 作品 全 集 ”以 及 历年 诺 
贝 系 文学 奖 获奖 作品 的 相关 信息 5 ,与 整理 后 的 热门 
图 书 进行 对 比 ,用 全 方位 数据 还 原 经 典 文学 作品 在 大 
学 生 阅 读 中 的 影响 力 ,另外 也 用 以 增强 模型 的 客观 性 


与 权威 性 。 


4 ”模型 构建 


根据 本 研究 的 评价 目的 与 评价 主体 ,把 大 学 生 的 
阅读 选择 作为 研究 重点 ,要 重 现 大 学 生 这 一 特定 群体 
中 受 欢迎 的 热门 TOP 图 书 , 就 需要 围绕 大 学 生 的 阅读 
意愿 , 辅 以 客观 数据 ,即将 “全 评价 ”体系 分 析 框 架 与 
层次 分 析 法 相 结合 ,构建 评价 模型 。 

AHP 是 一 种 较为 成 熟 的 ,定性 定量 相 结合 的 、 系 
统 化 ,层次 化 的 分 析 方 法 ,有 很 强 的 条 理性 和 科学 性 ， 
在 评价 体系 的 构建 中 应 用 广泛 。 根 据 AHP 系统 性 、 科 
学 性 、 适 用 性 的 指标 设 定 原则 ,制定 评价 标准 及 浏览 


量 、 出 版 社 \ 版 次 等 指标 ,建立 层次 结构 分 析 模 型 ,如 
1 所 示 : 


全 评价 0 
z 式 评 效用 评 内 党 评 价 
i 形式 从 效用 评价 
中 | 济 3 2 是 否 
指标 层 | 版 | | 次 到 | | 次 情 | | 推荐 
社 B2 量 数 况 书目 
Bl Gl D2 
wy Dl 


图 1 全 评价 层次 分 析 模 型 


模型 中 3 个 准则 层 与 6 个 指标 层 的 具体 含义 如 下 : 

Al 形式 评价 :图 书 的 出 版 社 个 数 与 版 次 ; 

A2 效用 评价 :浏览 量 与 出 现 次 数 ; 

A3 内 容 评价 :获奖 情况 与 被 推荐 情况 。 

Bl 出 版 社 数量 :出 版 该 种 书 的 出 版 社 数量 ; 

B2 出 版 频次 :同一 本 书 出 现 的 所 有 不 同 版 次 总 数 ; 

Cl 浏览 量 :经 过 消除 学 校 总 数 之 间 差 异 和 加 权 计 
算 等 数据 处 理 ,89 所 高 校 的 汇 文系 统 自 运行 之 初 至 
2016 年 的 浏览 总 量 ; 

C2 出 现 次 数 :89 所 高 校 TOP100 中 该 书 出 现 的 总 

D1 获奖 情况 :以 世界 权威 奖项 诺 贝尔 文学 奖 和 中 

权威 奖项 矛盾 文学 奖 为 评判 标准 ,统计 获奖 作品 给 
予 加 分 ; 

D2 被 推荐 情况 :以 高 教 司 大 学 生 必 读书 目 和 豆瓣 
推荐 热门 书 单 进行 匹配 ,统计 被 推荐 的 书目 给 予 加 分 。 

在 AHP 方法 中 ,最 根本 的 任务 是 建立 判断 矩阵 、 
求解 判断 矩阵 的 最 大 特征 根 及 特征 向 量 与 分 配 指标 权 
重 。 判 断 矩 阵 以 0-A 层 为 例 ,如 图 2 所 示 : 


加 


O-A Al A2 A3 Ww 
Al 1 2/3 全 RE) 
A2 1 1 设 1 ~ 1/2 
A3 172 1/3 Pp 1/6 


图 2 0-A 判断 矩阵 


本 研究 采用 和 积 法 来 求解 判断 矩阵 的 最 大 特征 根 
及 其 所 对 应 的 特征 向 量 , 这 些 数据 运算 可 以 用 Excel 来 


1/3 
实现 。 所 得 特征 向 量 丈 = 1/2 、 最 大 特征 值 A = > 
1/6 
AW), 入 一 
4 i CcR=C =0, 其 中 C1 = 表示 一 致 性 指 
nW., RI n-l 


标 (consistency index ) , 当 CI =0, 且 得 到 最 大 特征 值 
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a i 
LnlinaxIV 瑟 1 


Auu =3 时 ,表明 判断 矩阵 具有 完全 一 致 性 。 最 终 所 得 
指标 权重 分 配 如 表 3 所 示 : 
表 3 指标 权重 分 配 


原始 数据 为 89 所 国内 高 校 的 热门 浏览 图 书 ,本 研 
究 以 22 个 大 类 中 工 类 图 书 的 TOP100 为 例 进行 研究 ， 
其 中 热门 图 书 出 现 次 数 多 并 且 总 浏览 量 数据 庞大 ， 


准则 层 权重 指标 层 权重 此 AHP 中 赋予 各 项 指标 相应 权重 ,而 非 对 每 本 书 的 6 
A ee 31 OO 项 指标 分 别 进行 打分 。 根 据 所 得 模型 对 每 一 个 作品 进 
人 行 打分 并 排序 ,部 分 见 表 4, 表 4 中 的 著作 大 多 耳 熟 能 
en 2, 0 详 ,并 且 涵 盖 了 世界 文学 和 中 国文 学 。 
A3 0.11 D1 0.037 037 
D2 0.074 074 
表 4 2016 年 热门 浏览 图 书 加 权 得 分 TOP 40 
序号 作品 加 权 得 分 序号 作品 加 权 得 分 
1 平凡 的 世界 25.477 21 追 风筝 的 人 3.962 
2 小 王子 16. 926 22 皮 行 3.782 
百年 孤独 16. 182 23 三 国 演义 3.768 
围城 13.811 24 三 体 3.482 
红楼 梦 10. 295 25 目送 3.481 
麦田 里 的 守望 者 9. 823 26 福尔摩斯 探 案 全 集 3.406 
生命 中 不 能 承受 之 轻 9.751 27 1984 3.399 
倾城 之 恋 9.547 28 陋 的 中 国人 3.21 
穆斯林 的 匡 礼 9.011 29 霍乱 时 期 的 爱情 3.19 
挪威 的 森林 8.746 30 瓦尔 登 油 3.101 
盗墓 笔记 7.926 31 草 环 鸟 3.044 
傲慢 与 偏见 6.946 32 红 与 黑 3.032 
对 6.87 33 金瓶 梅 2.994 
苏 菲 的 世界 6. 405 34 致 我 们 终 将 逝去 的 青春 2.983 
活着 6.399 35 冰 与 火 之 歌 2. 961 
达 ，: 芬 奇 密码 6.368 36 情人 2. 886 
鹿 原 6.32 37 京华 烟云 2. 868 
了 不 起 的 盖 茨 比 5.871 38 撒哈拉 的 故事 2. 842 
狼 图 腾 4.659 39 哈 利 . 波 特 系列 2.753 
基督 山 伯 档 4.165 40 藏 地 密码 2.707 


5 模型 检测 
5.1 数据 检测 

大 数据 能 够 在 更 大 程度 上 重 现 大 学 生 的 阅读 现 
状 ,对 数据 进行 整理 研究 是 为 了 进行 有 效 的 推广 实践 。 


对 比 结果 来 看 ,模型 所 得 结果 可 信 度 较 高 ,这 也 证 明了 
热门 TOP 图 书 推荐 在 图 书馆 的 阅读 推广 中 有 着 重要 
的 现实 意义 。 

同时 对 比 模型 所 得 两 年 的 数据 可 以 发 现 , 在 某 一 
阶段 被 多 种 媒体 广泛 传播 的 作品 很 受 大 学 生 欢 迎 , 浏 


为 了 检测 本 研究 模型 的 有 效 性 ,根据 2017 年 7 月 的 最 
新 数据 ,利用 上 文 的 层次 分 析 法 进行 检测 ,得 出 2017 
年 热门 浏览 图 书 加 权 得 分 , 见 表 5。 

对 比 表 4 与 表 5 这 两 次 由 模型 得 出 的 结果 可 见 ， 
部 分 作品 排名 上 有 所 变动 ,TOP40 中 有 6 部 作品 发 生 
改变 ,经 查找 ,这 6 部 作品 均 可 在 2016 年 热门 图 书 
TOP100 中 找到 。 该 结果 证 明 这 些 文学 热门 TOP 图 书 
在 排名 上 有 小 范围 浮动 ,但 是 在 高 校 读者 的 兴趣 度 上 ， 
“TOP" 地 位 不 容 置疑 ,通过 2016 年 与 2017 年 的 排行 
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览 量 也 在 短 时 间 内 有 所 增长 ,例如 今年 上 映 的 电影 《 嫌 
疑 人 X 的 献身 》 改 编 自 东野 直 吾 的 悬疑 小 说 ,该 小 说 
被 收录 于 新 经 典 文 库 ,在 2016 年 的 阅读 排行 榜 中 排名 
73 ,在 2017 年 排名 上 升 到 第 31 名 ,电影 以 及 电视 剧 的 
推广 与 原著 相互 促进 ;类 似 的 还 有 翻拍 成 电影 和 电视 
剧 的 《 白 鹿 原 》, 由 2016 年 的 16 名 上 升 到 2017 年 的 10 
名 。 除 了 这 些 本 就 “热门 ”的 作品 ,还 有 一 些 娱乐 性 
“流行 作品 ”, 例 如 《 左 耳 《何以 笔 第 默 《 杜 拉 拉 升 职 
记 》 等 电影 电视 剧 的 热 播 ,也 带动 了 网 络 小 说 的 流行 ， 


刘 丽 帆 ， 朱 紫阳 . 基于 “全 评价 ”理论 的 高 校 图 书 
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表 5 2017 年 热门 浏览 图 书 加 权 得 分 TOP 40 


序号 作品 加 权 得 分 序号 作品 加 权 得 分 
1 平凡 的 世界 21.406 21 三 体 3.236 
2 小 王子 16. 403 22 夜行 3.143 
3 百年 孤独 14.350 23 红 与 黑 3.120 
4 围城 12. 130 24 追 风 筝 的 人 3.056 
5 红楼 梦 9.701 25 黄金 时 代 2. 926 
6 麦田 里 的 守望 者 9.251 26 目送 2.780 
7 倾城 之 恋 8.219 27 基督 山 伯 档 2.726 
8 挪威 的 森林 7.922 28 撒哈拉 的 故事 2.706 
9 穆斯林 的 葬礼 7.374 29 我 们 个 2. 644 
10 鹿 原 6. 801 30 狼 图 腾 2.619 
11 盗墓 笔 记 6.757 31 妊 疑 人 X 的 献身 2.544 
12 结 6.538 32 陋 的 中 国人 2.542 
13 傲慢 与 偏见 6.044 33 致 我 们 终 将 逝去 的 青春 2.502 

活着 5.647 34 月 之 与 六 便士 2.427 

了 不 起 的 盖 茨 比 5.576 35 文化 若 旅 2 .408 
苏 菲 的 地界 4.751 36 冰 与 火 之 歌 2.394 
生命 中 不 能 承受 之 轻 4. 573 37 边城 2.356 
1984 4.012 38 京华 烟云 2.323 

瓦尔 登 湖 3.836 39 情人 2.284 
霍乱 时 期 的 爱情 3.427 40 哈 利 . 波 特 系 列 2. 179 


本 四 二 检索 借阅 馆藏 级 本 图 书 ,网 络 平 台 刊载 的 网 红 
/四 其 节奏 址 便捷 的 特性 往往 更 容易 被 当代 大 
所 青睐, 所 以 其 较 高 的 排名 并 未 得 以 延续 ,2017 
年 了 e2016 年 排名 分 别 下 降 25 .24 .30 名 。 因 此 ,笔者 
相信 时 代 的 潮流 会 为 热门 TOP 图 书 注入 新 的 活力 ,网 
络 星体 也 会 对 学 生 阅读 造成 多 方面 的 冲击 ,在 对 待 当 
代 丑 学 生 的 阅读 现状 时 ,应 以 客观 .理性 和 包容 的 必 
态 ; 毕 合 当下 形势 ,在 图 书馆 资源 建设 和 阅读 推广 等 方 
面 ,提出 符合 实际 的 改进 措施 和 提升 路 径 。 
通过 模型 将 两 年 数据 的 结果 进行 对 比 ,可 以 从 一 
定 程度 上 检测 模型 的 准确 度 , 该 方法 仅 用 于 数据 匹配 ， 
检测 排名 出 现 变动 的 作品 ,但 是 并 不 能 解释 模型 确实 
可 行 ,可 信 度 并 不 是 很 充分 ,因此 选择 C 5.0 算法 对 模 
型 的 可 行 性 和 准确 度 进行 检验 。 
5.2 C5.0 算法 检测 

决策 树 模型 是 一 种 适用 于 非 数值 型 数据 的 规则 扒 
理 模型 ,C 5.0 是 其 中 较为 经 典 的 算法 之 一 ,生成 的 规 
则 集 易于 理解 ,并 且 可 生成 更 简单 明了 的 决策 树 图 形 。 
AHP 是 通过 简单 的 算法 语句 对 各 要 素 进行 加 权 处 理 ， 
而 C 5.0 算法 可 以 检验 模型 中 字段 的 有 用 性 ,检测 层 
次 分 析 法 的 准确 度 , 对 所 生成 模型 进行 评价 。 

C 5.0 算法 要 求 输入 变量 是 分 类 型 或 数值 型 ,最 终 
输出 变量 为 分 类 型 ,算法 自身 根据 信息 增益 率 确 定 决 


策 树 的 分 支 准 则 ,寻找 最 佳 的 分 组 变量 和 分 割 点 。 本 
研究 中 数据 为 数值 型 ,主要 输入 变量 为 模型 结果 中 的 
加 权 得 分 .浏览 总 量 .出 现 次 数 等 数据 ,输出 结 
否 视 为 “热门 TOP 图 书 ” 与 “ 非 热 门 TOP 图书” 

“YES” 或 “NO”。 为 保证 所 提出 模型 的 准确 性 ， 
利用 C 5.0 算法 对 2017 年 数据 进行 预测 , 若 预测 结果 
与 AHP 所 得 结果 吻合 度 高 , 则 可 认为 以 上 模型 有 效 ， 
反之 则 为 无 效 , 预 测 同时 添加 evaluation 节点 进行 模型 
评价 。 

将 模型 所 得 结果 即 模型 数据 表格 导入 Clemen- 
tine 的 表格 节点 ,在 表格 节点 后 添加 C 5.0 算法 节 
点 并 执行 流 , 添 加 模型 节点 并 生成 决策 树 , 导 出 模 
型 所 生成 的 决策 树 。 算 法 中 所 用 的 规则 集 生 成 决 
策 树 见 图 3。 

从 图 3 中 可 以 看 到 ,将 2017 年 结果 中 的 前 8.56% 
视 为 “热门 TOP 图书” ,经 过 规则 集 的 预测 与 判别 之 后 
所 导出 的 Table 中 ,预测 结果 的 “YES” 与 “NO” 和 本 研 
究 模 型 所 得 “热门 TOP 图 书 ” 与 “ 非 热 门 TOP 图 书 ” 相 
对 应 ,经 统计 “YES” 和 “热门 TOP 图 书 ” 的 吻合 度 为 
93.3%,“NO” 和 “ 非 热 门 TOP 图 书 ” 的 吻合 度 为 
99.1% ,决策 树 预测 结果 与 模型 所 得 结果 吻合 度 较 高 ， 
验证 了 本 研究 所 构建 模型 的 有 oe 

除了 模型 的 有 效 性 ,算法 通 


过 evaluation 节点 也 给 
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节点 1 节点 6 

类 别 % n 
NO 99.341 1508 
MvYES 0.659 10 
总 计 90.898 1518 


NO 12.500 19 
但 YES_87.500 133 
总 计 9.102 152 


浏览 量 总 数 浏览 量 总 数 


广 一 


<=0075 > 0.075 <=0.064 > 0.064 


7 ET 
类 中 % nmn| | 类 中 %  n 
NO 39.583 19 NO 0.000 0 


节点 2 节点 3 
类 别 % nm|| 类别 % _n 
NO 100.000 1493| | 覃 NO 60.000 15 
团 YES 0.000 0| ImYEs 40.000 10 
总 计 89.401 1493| | 总 计 1497 25 


YES 60.417 29 硬 YES 100.000 104 
总 计 2874 48| | 总 计 6228 104 


版 次 


CD 总 计 0838 14 
图 
CD NO 100.000 
ves 0.000 
CN 总 计 0.778 
| <= 5000 >5.000 
节点 11 节点 12 
类 别 % mn 类 别 % _n 


NO 100000 5 NO ”0.000 
至 YES 0000 0| | 里 YES 100.000 
总 计 0299 5| | 总 计 0479 8 


mo 


3 C5.0 算法 决策 树 


chinaXiv 


0 20 40 60 80 100 


Percentile 


加 权 得 分 =“NO” 


SC- 加 权 得 分 
$C- 加 权 得 分 


出 了 对 模型 的 评价 。 在 图 4 评价 结果 中 可 看 到 ,Cains 
图 在 前 期 较为 快速 达到 100% 并 趋 于 平稳 ,Lift 图 首先 
在 较 高 的 累计 Lift 值 上 保持 较 长 一 段 然 后 迅速 下 降 到 
1 ,两 个 评价 图 像 趋势 都 较为 理想 ,证 明 算法 对 模型 的 
评价 结果 较 好 。 预 测 与 评价 结果 都 证 明 本 研究 所 构建 
模型 较 好 且 准 确 度 较 高 ,是 一 个 合适 的 、 可 用 来 评价 适 
合 大 学 生 阅 读 的 热门 TOP 图 书 的 评价 模型 。 


本 研究 试图 从 读者 角度 考量 阅读 推广 的 方式 方法 
以 及 具体 内 容 , 综 合 * 全 评价 "理论 体系 与 层次 分 析 模 
型 ,构建 高 校 图 书馆 热门 TOP 图 书 推荐 模型 ,通过 计 
算 高 校 图 书馆 文学 类 图 书 浏览 数 、 出 版 版 次 、 获 奖 情况 
等 指标 层 ,得 到 相关 结论 性 数据 ,并 利用 决策 树 模型 对 
结果 进行 预测 和 评价 ,证 明 其 有 效 性 ,最 终 为 大 学 生 群 
体 提 供 了 一 份 热门 TOP 图 书 书 单 ,其 结果 不 仅 可 以 用 
于 阅读 推广 ,从 另 一 角度 而 言 ,对 单个 图 书馆 的 资源 建 
设 也 大 有 神 益 。 同 时 ,本 研究 在 研究 方法 上 也 还 存在 
诸多 不 成 熟 的 地 方 , 例 如 文中 所 用 层次 分 析 法 较为 简 
单 , 受 数据 层面 的 限制 ,在 评价 体系 构建 中 的 指标 设置 
尚未 做 到 全 面 ,因而 在 今后 的 研究 中 将 会 拓展 数据 维 
度 ,完善 指标 体系 ,改进 不 足 之 处 ,做 到 与 “全 评价 ” 体 
系 理论 和 实际 应 用 的 有 效 结合 。 

阅读 本 身 就 是 读者 自发 的 一 种 行为 ,无 论 是 作为 
学 习 还 是 娱乐 消遣 的 方式 ,都 有 着 一 定 的 目的 ,这 些 目 
的 也 可 以 理解 为 读者 阅读 的 动力 来 源 。 将 大 多 数 高 校 
的 大 学 生 阅读 行为 进行 整合 分 析 ， 有 助 于 了 解 这 一 代 
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4C- 加 权 得 分 
4$C- 加 权 得 分 


Percentile 


加 权 得 分 =“NO” 


4 模型 评价 Gains 图 与 Lift 


人 的 阅读 状况 ,对 于 大 学 生 自 身 阅读 能 力 的 提升 有 着 
重要 意义 。“ 热 门 图 书 " 或 者 "排行 榜 " 都 代表 着 一 种 
建议 ,本 研究 旨 在 通过 实证 研究 让 大 学 生 了 解 同龄 人 
阅读 状况 .与 自身 进行 对 比 ,发 掘 自身 兴趣 。 以 学 生 自 
映 的 个 人 兴趣 为 出 发 点 ,再 通过 契合 有 效 的 推荐 方式 ， 
两 者 相 结 合 才 能 更 好 地 提升 高 校 学 生 的 阅读 水 平 。 


Len 
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QAbstract. [Purpose/significance | This paper tries to build a recommendation model of hot TOP books for college 
students and provides a reference for the academic libraries ”reading promotion. | Method/process | Based on the colla- 
tion, analysis and mining of the retrieval data from 89 domestic university libraries’” OPAC, this article analyses and eval- 
uates the reading tendency of academic students by means of the all-around evaluation theory system and the combination 
of AHP and decision tree model. [ Result/conclusion ] The paper, through prediction and evaluation finally proves that 
the model is reasonable and accurate, and has important practical significance. 
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